#数据类型

#一、异步加载
'''
向网站进行一次请求，一次只传部分数据

网页开发工具下network-->选择XHR，寻找异步加载数据包（json格式）

'''

#二、豆瓣电影 --翻页获取

import requests

#异步数据加载数据包下面的Request URL,黏贴过来'
url ='https://m.douban.com/rexxar/api/v2/subject/recent_hot/movie?start=0&limit=20'


#请求头
headers = {
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/136.0.0.0 Safari/537.36 Edg/136.0.0.0'
}

#找到翻页规律，把第一次抓包的URL，安翻页规律使用for循环进行翻页
for i in range(3):  #翻3页
    url = 'https://m.douban.com/rexxar/api/v2/subject/recent_hot/movie?start={i*20}&limit=20'

    #建立响应对象
    res = requests.get(url,headers=headers)

    #打印响应内容
    print(res.text)


#三、文本数据分类
'''
1.结构化响应内容：
json字符串：可使用re、json模块来提取特定的数据
xml字符串：可使用re、lxml来提取待定的数据


2.非结构化响应内容：
html字符串：可使用re、lxml来提取特定的数据


xml和html区别
xml：可扩展标记语言，样子和html很像，功能更专注于对数据的传输和存储，侧重数据内容本身
html：超文本标记语言，显示数据，侧重点是为了显示
'''

#四、json格式和python格式的互相转换

#导入模块
import json

dic = {"name":"哈哈"}
#print(type(dic))

#python数据转换为json数据  json.dumps()
dic2 = json.dumps(dic,ensure_ascii=False) #ensure_ascii=False表示不用asc码编译
print(dic2)
print(type(dic2))


#json数据转换为python数据  json.loads()
dic3 = json.loads(dic2)
print(dic3)
print(type(dic3))
